Agrégation de traces d'exécution pour la visualisation de grands systèmes distribués

نویسندگان

  • Robin Lamarche-Perrin
  • Lucas Mello Schnorr
  • Jean-Marc Vincent
  • Yves Demazeau
چکیده

RÉSUMÉ. La visualisation de performance consiste à représenter graphiquement l’exécution d’applications parallèles pour procéder à leur analyse. Dans le cas de très grands systèmes, l’agrégation des données analysées est inévitable. Cet article met en évidence un problème scientifique majeur : comment produire des représentations agrégées qui ont un sens lors du passage à l’échelle ? Quatre éléments de réponse sont discutés. (1) Les outils de visualisation doivent garantir la compréhension et le contrôle par l’utilisateur du procédé d’agrégation. (2) Il est crucial d’estimer la qualité des représentations engendrées afin de distinguer les agrégations utiles (suppression d’informations redondantes) de celles qui sont dangereuses pour l’analyse (perte d’informations importantes). Nous proposons des mesures issues de la théorie de l’information pour quantifier ces deux aspects et pour ainsi engendrer des représentations multirésolutions (agrégation de données redondantes et conservation des données hétérogènes). (3) Les propriétés sémantiques et topologiques du système doivent également être prises en compte afin de garantir la juste interprétation des agrégats par l’utilisateur. La recherche des agrégations optimales est ainsi restreinte à un ensemble d’agrégations pertinentes sur le plan sémantique. (4) Des méthodes de calcul sophistiquées sont alors nécessaires pour sélectionner les agrégations optimales lors du passage à l’échelle. Nous proposons un algorithme à complexité linéaire (dans le cas de systèmes hiérarchiques) parvenant à agréger jusqu’à un million d’entités et garantissant l’interprétabilité des visualisations engendrées.

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Visualization and Detection of Resource Usage Anomalies in Large Scale Distributed Systems

Understanding the behavior of large scale distributed systems such as clouds, computing grids or volunteer computing systems is generally extremely di cult and tedious as it requires to observe a very large number of components over a very large period of time. The analysis of distributed systems generally begins with gathering resource utilization monitoring data through the use of observation...

متن کامل

Dependability Analysis of Control Systems using SystemC and Statistical Model Checking

Stochastic Petri nets are commonly used for modeling distributed systems in order to study their performance and dependability. This paper proposes a realization of stochastic Petri nets in SystemC for modeling large embedded control systems. Then statistical model checking is used to analyze the dependability of the constructed model. Our verification framework allows users to express a wide r...

متن کامل

Mémoires partagées distribuées pour systèmes dynamiques à grande échelle

La plupart des systèmes distribués modernes sont à la fois à grande échelle et dynamiques. Cet article met en avant le passage des systèmes distribués classiques aux systèmes dynamiques à grande échelle. Bien que la réplication d’un objet (i.e., d’une donnée) à plusieurs endroits du réseau tolère les défaillances, cette technique implique un coût considérable à chaque modification de la valeur ...

متن کامل

SVM et visualisation pour la fouille de grands ensembles de données

Résumé. Nous présentons un algorithme de SVM et des méthodes graphiques pour le traitement de grands ensembles de données. Pour pouvoir traiter de tels ensembles de données, nous utilisons une représentation des données de plus haut niveau (sous forme symbolique). L’algorithme de séparateur à vaste marge (SVM) est adapté pour pouvoir traiter ce nouveau type de données. Nous construisons un nouv...

متن کامل

Interactive Analysis of Large Distributed Systems with Topology-based Visualization

The performance of parallel and distributed applications is highly dependent on the characteristics of the execution environment. In such environments, the network topology and characteristics directly impact data locality and movements as well as contention, which are key phenomena to understand the behavior of such applications and possibly improve it. Unfortunately few visualization availabl...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:
  • Technique et Science Informatiques

دوره 33  شماره 

صفحات  -

تاریخ انتشار 2014